如何编写Unicode源代码
标准的C运行期字符串函数,如strcpy、strchr和strcat只能对ANSI字符串进行操作,不能正确的处理Unicode字符串,因此,ANSI C拥有一组补充函数,例如:
12char* strcat(char*, const char*);wchar_t* wcscat(wchar_t*, const wchar_T*);所有的Unicode函数均以wcs开头,wcs表示宽字符串
如果需要创建同时为ANSI何Unicode进行编译的单一源代码文件,必须包含TChar.h文件,而不是包含String.h文件。Tchar.h文件的唯一作用是帮助创建ANSI/Unicode通用源代码文件,它包含你应该用在源代码中的一组宏,而不应该直接调用str函数或wcs函数。如果在编译源代码文件中定义了_UNICODE,这些宏就会引用wcs这组函数,否则,引用str这组函数。
若要定义一个ANSI/Unicode通用的字符串数组,请使用下面的TCHAR数据类型。如果定义了_UNICODE,TCHAR将声明为下面的形式:
1typedef wchar_t TCHAR如果没有定义_UNICODE,则TCHAR将声明为下面的形式:
1typedef char TCHAR使用该数据类型,可以向下面这样拍分配一个字符串:
1TCHAR szString[100];也可以创建对字符串的指针:
1TCHAR* szError = "Error"上面这行代码存在一个问题,如果没定义_UNICODE,该编译器将能正确的编译这一行代码;但是,如果定义了
__UNICODE
,将会产生一个错误。若要生成一个Unicode字符串而不是ANSI字符串,必须将该代码改写成下面的样子:
1TCHAR* szError = L"Error";字符串前面的L用于告诉编译器该字符串作为Unicode字符串来编译,然而现在只有当定义了_UNICODE时程序才能正常编译。
我们需要另一个宏,以便有选择的在字符串前面加上大写字母L。这项工作由_TEXT宏来完成,
__TEXT
宏也在TChar.h文件中做了定义。如果定义了__UNICODE
,那么__TEXT定义成下面的形式:1如果没有定义,则定义成下面这种形式:
1Windows定义了以下的一些Unicode数据类型:
WCHAR: Unicode字符
PWSTR 指向Unicode字符串的指针
PCWSTR 指向一个恒定的Unicode字符串的指针
这些数据类型是指Unicode字符和字符串,Windows头文件中也定义了ANSI/Unicode通用数据类型PTSTR和PCTSTR,这些数据类型既可以指ANSI字符串,也可以指Unicode字符串,这取决于当编译模块是否定义了UNICODE宏。